Datawhale AI 夏令营- 讯飞机器翻译挑战赛task2:baseline代码详解

这张图展示了经典的RNN架构,其中每个垂直矩形框都是时间步长t的隐藏层,每个这样的层都包含若干神经元,每个神经元对其输入执行线性矩阵运算,然后执行非线性运算(例如tanh())。语言模型需要计算特定序列中...